Fusion de multi-modalités et réduction par sémantique latente

نویسندگان

  • Trong-Ton Pham
  • Jean-Pierre Chevallet
  • Joo-Hwee Lim
چکیده

This paper studies Latent Semantic Analysis (LSA) between visual and textual elements of a multimedia collection, applied on two different tasks: (1) multimedia document retrieval (MDR) and (2) automatic image annotation (AIA). Latent semantics, usually used for text indexing, is applied to discover hidden semantic relations between visual and textual descriptors. The contributions of this paper are twofold. First, to the best of our knowledge, this work is the first study of the influence of LSA on the retrieval of a significant number of multimedia documents (i.e. collection of 20000 tourist images). Second, it shows how different image representations (region-based and keypoint-based) can be combined by LSA to improve automatic image annotation. The document collections used for these experiments are the Corel photo collection and ImageCLEF 2006 collection. MOTS-CLÉS : Recherche d’information, annotation automatique, sémantique latente, modèle de fusion

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modeling Semantic Memory

Computational models of semantics infer semantic structure from the analysis of large linguistic corpora. Two approaches are described here. In each case the data consist of a document-by-word matrix, counting the number of times a word was used in a document. Latent Semantic Analysis uses dimension reduction to construct a high-dimensional semantic space from such a matrix. Information in sema...

متن کامل

Exploration d'une collection de chansons à partir d'une interface de visualisation basée sur une analyse des paroles

Résumé. Dans cet article, nous présentons une approche de fouille de textes ainsi qu’une interface de visualisation afin d’explorer une large collection de chansons frana̧ises à partir des paroles. Dans un premier temps, nous collectons paroles et métadonnées de différentes sources sur le Web. Nous utilisons une approche combinant clustering et analyse sémantique latente afin d’identifier différ...

متن کامل

Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d'histoires

RÉSUMÉ. Les séries télévisées récentes multiplient les personnages principaux, développant ainsi des intrigues complexes présentées à travers plusieurs histoires entremêlées. Nous proposons une approche de détection automatique de ces histoires afin de générer un résumé vidéo par extraction de scènes représentatives de ces dernières, et nous présentons un outil de visualisation rapide des histo...

متن کامل

Analyse Texte et Image pour la caractérisation de l'activité dans les Films d'Animation

RÉSUMÉ. Définir une indexation pertinente sur le contenu sémantique des films ou vidéos est un défi actuel. Nous proposons de rechercher et de caractériser l’activité contenue dans un film à partir d’une analyse conjointe texte et image. L’analyse des images nous donne de nombreux indicateurs, pauvres en sémantique, tandis que l’étude des textes courts que sont les synopsis nous donne des indic...

متن کامل

Knowledge evaluation based on LSA: MCQs and free answer questions

In this paper, we present an application using the SUMMA-LSA platform developed by Baier, Lehnard, Hoffmann & Schneider (this volume). SUMMA-LSA was used to evaluate biology knowledge of 7th and 8th grades students dealing with !The human body energy requirements ". Student knowledge has been measured by means of classical and “evidential” multiple choices questions (MCQs) as well as open quest...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008